技術問答
技術文章
iT 徵才
聊天室
2026 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
第 12 屆 iThome 鐵人賽
DAY
22
1
IoT
手拉手教自己用樹梅派、GoogleHome、GCP做一個AI智慧提醒機器人!
系列 第
22
篇
Day22 Dataprep
12th鐵人賽
A Li
2020-10-07 13:01:34
1165 瀏覽
分享至
Dataprep本身是google GCP與Trifacta提供的服務,著重於資料
Visually Exploring
Cleaning
Preparing structured and unstructured data for analysis, reporting, and machine learning.
首先進GCP搜尋Dataprep,
右上有提供主要的兩個服務
import data : 負責導入資料
create flow : 讓你設計資料的處理與流程
第一步import data 提供三種方式
upload : 本地上傳。
GCS : 可以使用firebase storage內的檔案。
Big Query : 可以使用big query內的檔案。
下一步使用creat flow
點擊右側,使用library 加入你已import的data
產生data後,點擊他右側的+號:
add new recipe : 資料處理。
add join : 進行不同欄位合併。
add union : 進行同欄位資料增加。
進行 edit recipe
會出現key與另一欄位,key會記錄專案名稱及路徑而另一欄位為document資訊,點擊後進行unnest及名稱修改即可產生如下圖:
之後依您需求進行join及union,之後進recipe右上即可執行run job,點擊action可改變產生得檔案
這邊我選擇進行產生json,再進行run job即可。
留言
追蹤
檢舉
上一篇
Day21 導出firebase資料(using dataflow)
下一篇
Day23 sql查詢指令
系列文
手拉手教自己用樹梅派、GoogleHome、GCP做一個AI智慧提醒機器人!
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
Day 26 我們來寫個網頁吧(Angular)
27
Day27 firbase hosting
28
Day28 firebase authentication
29
Day29 利用web發送訊息(上)
30
Day30 利用web發送訊息(下)
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19831
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
誰能證明AI是一場公司的大災難
鼎新ERP /SMART 專案成本分析..
延續誰能證明ai是場災難
Connect-AzureAD 的 powershell 指令
Debian 13 安裝 bind9 後找不到範例檔
MATABASE 多期比較問題請教
當盡力效勞堅持崗位下的自己和我們,會不會有時覺得只剩過勞
熱門回答
誰能證明AI是一場公司的大災難
鼎新ERP /SMART 專案成本分析..
Connect-AzureAD 的 powershell 指令
Debian 13 安裝 bind9 後找不到範例檔
當盡力效勞堅持崗位下的自己和我們,會不會有時覺得只剩過勞
熱門文章
終結輪詢噩夢:量化交易系統如何優雅地接收跨境股市即時串流?
好想跟 Discord 聊天就把專案寫好 : Claude Code Channels
AI網管課 - 怎麼建置10人網路 (概念篇)
筆記:.NET 併發處理 Async/Await 筆記
如何設計自己的遊戲開發同事
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}